Day 03 . LLM是啥? 應該不是Lxli Loves Me吧

2025 iThome 鐵人賽

DAY 3

生成式 AI

30天從不認識生成式AI到好像稍微可能有點熟悉的過程系列第 3 篇

17th鐵人賽

jiaofish

團隊週三遜咖日

2025-09-10 17:18:17

424 瀏覽

分享至

標題好像暴露了一些奇怪的東西，但是我們先不要在意那些小細節
咳咳總之今天我要來介紹的就是LLM是甚麼東東

LLM 的全名是 Large Language Model, 也就是大型語言模型
把每一個單字拆解開來就是
Large:代表它是用超大規模的參數（可能有到數十億到上千億）與龐大的資料集訓練出來的。
Language：它專門處理語言資料像是文字、程式碼之類的。
Model：是一個數學模型，用來模擬語言規律。
簡單來說LLM 是一種「透過大量文字學會語言規律的統計模型」。

所以LLM是怎麼生成內容的?
LLM會根據前面的內容，來預測下一個最有可能出現的字或詞
像是我們在手機上打「今天的天氣很…」，手機一般的補字系統可能會出現「好」、「讚」、「爛」、「爽」之類的幾個選項。
而LLM則會根據他的訓練資料跟上下文來判斷「好」出現的機率50%、「讚」30%、「爛」15%、「爽」4%，然後選擇一個最合理的選項後，繼續往下計算。
推算的過程會一個字一個字的計算下去，直到完整的的句子完成為止。

跟手機補字系統的差別
看到上面的用途，有些人就會覺得說啊不是跟手機上的推薦選項差不多，他們差別在哪裡?
手機補字系統通常只會看我們上一個打的字或詞，然後來給我們建議的詞彙，用途基本上就是讓我們輸入的速度變快一點而已。
而LLM看到的上下文可以到上千字，所以LLM除了可以在文章上幫我們補字以外，還可以直接寫一個完整的文章、翻譯、回大問題、推理等，應用的場景比較多。